Can AI Match Human Experts? Evaluating LLM-Generated Feedback on Resident Scholarly Projects
Hoewel menselijke experts over het algemeen betere feedback geven op residentieel onderzoek, kan een open-weight LLM (LLaMA-3.1) met gecurateerde prompts in bepaalde contexten en bij veiligheidsbeoordelingen feedback van vergelijkbare kwaliteit genereren, waardoor schaalbare ondersteuning mogelijk wordt.